مقایسه مدل هاي حاشیه اي و انتقال براي تحلیل پاسخ هاي دو حالتی: یک مطالعه شبیه سازي

Σχετικά έγγραφα
محاسبه ی برآیند بردارها به روش تحلیلی

جلسه 3 ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک کوانتمی بیان. d 1. i=0. i=0. λ 2 i v i v i.

آزمایش 1: پاسخ فرکانسی تقویتکننده امیتر مشترك

روش محاسبه ی توان منابع جریان و منابع ولتاژ

تصاویر استریوگرافی.

جلسه ی ۱۰: الگوریتم مرتب سازی سریع

همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین

آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ(

آزمایش 8: تقویت کننده عملیاتی 2

هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه

جلسه 12 به صورت دنباله اي از,0 1 نمایش داده شده اند در حین محاسبه ممکن است با خطا مواجه شده و یکی از بیت هاي آن. p 1

جلسه 22 1 نامساویهایی در مورد اثر ماتریس ها تي وري اطلاعات کوانتومی ترم پاییز

مثال( مساله الپالس در ناحیه داده شده را حل کنید. u(x,0)=f(x) f(x) حل: به کمک جداسازی متغیرها: ثابت = k. u(x,y)=x(x)y(y) X"Y=-XY" X" X" kx = 0

تخمین با معیار مربع خطا: حالت صفر: X: مکان هواپیما بدون مشاهده X را تخمین بزنیم. بهترین تخمین مقداری است که متوسط مربع خطا مینیمم باشد:

جلسه 15 1 اثر و اثر جزي ی نظریه ي اطلاعات کوانتومی 1 ترم پاي یز جدایی پذیر باشد یعنی:

جلسه 14 را نیز تعریف کرد. عملگري که به دنبال آن هستیم باید ماتریس چگالی مربوط به یک توزیع را به ماتریس چگالی مربوط به توزیع حاشیه اي آن ببرد.

جلسه 9 1 مدل جعبه-سیاه یا جستاري. 2 الگوریتم جستجوي Grover 1.2 مسا له 2.2 مقدمات محاسبات کوانتمی (22671) ترم بهار

ﯽﺳﻮﻃ ﺮﯿﺼﻧ ﻪﺟاﻮﺧ ﯽﺘﻌﻨﺻ هﺎﮕﺸﻧاد

هو الحق دانشکده ي مهندسی کامپیوتر جلسه هفتم

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت

2/13/2015 حمیدرضا پوررضا H.R. POURREZA 2 آخرین گام در ساخت یک سیستم ارزیابی آن است

جلسه ی ۴: تحلیل مجانبی الگوریتم ها

1) { } 6) {, } {{, }} 2) {{ }} 7 ) { } 3) { } { } 8) { } 4) {{, }} 9) { } { }

عنوان: رمزگذاري جستجوپذیر متقارن پویا

تحلیل الگوریتم پیدا کردن ماکزیمم

پروژه یازدهم: ماشین هاي بردار پشتیبان

قاعده زنجیره ای برای مشتقات جزي ی (حالت اول) :

فصل دهم: همبستگی و رگرسیون

جلسه 16 نظریه اطلاعات کوانتمی 1 ترم پاییز

مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل

جلسه 2 جهت تعریف یک فضاي برداري نیازمند یک میدان 2 هستیم. یک میدان مجموعه اي از اعداد یا اسکالر ها به همراه اعمال

بررسی خرابی در سازه ها با استفاده از نمودارهاي تابع پاسخ فرکانس مجتبی خمسه

جلسه دوم سوم چهارم: مقدمه اي بر نظریه میدان

مدار معادل تونن و نورتن

مسائل. 2 = (20)2 (1.96) 2 (5) 2 = 61.5 بنابراین اندازه ی نمونه الزم باید حداقل 62=n باشد.

Angle Resolved Photoemission Spectroscopy (ARPES)

Answers to Problem Set 5

شاخصهای پراکندگی دامنهی تغییرات:

دانشکده ی علوم ریاضی جلسه ی ۵: چند مثال

تحلیل مدار به روش جریان حلقه

تلفات خط انتقال ابررسی یک شبکة قدرت با 2 به شبکة شکل زیر توجه کنید. ژنراتور فرضیات شبکه: میباشد. تلفات خط انتقال با مربع توان انتقالی متناسب

جلسه 28. فرض کنید که m نسخه مستقل یک حالت محض دلخواه


تئوری جامع ماشین بخش سوم جهت سادگی بحث یک ماشین سنکرون دو قطبی از نوع قطب برجسته مطالعه میشود.

آموزش SPSS مقدماتی و پیشرفته مدیریت آمار و فناوری اطالعات -

جلسه ی ۲۴: ماشین تورینگ

ویرایشسال 95 شیمیمعدنی تقارن رضافالحتی

مکانيک جامدات ارائه و تحليل روش مناسب جهت افزایش استحکام اتصاالت چسبي در حالت حجم چسب یکسان

حفاظت مقایسه فاز خطوط انتقال جبرانشده سري.

جلسه 2 1 فضاي برداري محاسبات کوانتمی (22671) ترم بهار

بسم اهلل الرحمن الرحیم آزمایشگاه فیزیک )2( shimiomd

جلسه ی ۵: حل روابط بازگشتی

معادلهی مشخصه(کمکی) آن است. در اینجا سه وضعیت متفاوت برای ریشههای معادله مشخصه رخ میدهد:

تحلیل فرسایش ابزار در ماشینکاري فولاد

Downloaded from irje.tums.ac.ir at 23:24 IRDT on Saturday April 21st 2018

سايت ويژه رياضيات درسنامه ها و جزوه هاي دروس رياضيات

جریان نامی...

جلسه ی ۳: نزدیک ترین زوج نقاط

Nonparametric Shewhart-Type Signed-Rank Control Chart with Variable Sampling Interval

آشنایی با پدیده ماره (moiré)

تمرینات درس ریاض عموم ٢. r(t) = (a cos t, b sin t), ٠ t ٢π. cos ٢ t sin tdt = ka۴. x = ١ ka ۴. m ٣ = ٢a. κds باشد. حاصل x٢

محاسبات کوانتمی 1 علم ساخت و استفاده از کامپیوتري است که بر پایه ي اصول مکانیک کوانتم قرار گرفته است.

فعالیت = ) ( )10 6 ( 8 = )-4( 3 * )-5( 3 = ) ( ) ( )-36( = m n m+ m n. m m m. m n mn

آزمون فرضیه و بازة اطمینان دقیق براي میانگین توزیع نمایی تحت سانسور دورگە پیش روندة نوع اول

تعیین محل قرار گیری رله ها در شبکه های سلولی چندگانه تقسیم کد

( )= ( ) ( ) ( 1) ( d) d w و ( ) =

تخمین نقطه تغییر در ماتریس کواریانس فرآیند نرمال چند متغیره با استفاده از شبکه عصبی

Beta Coefficient نویسنده : محمد حق وردی

دانشکده علوم ریاضی دانشگاه گیلان آزمون پایان ترم درس: هندسه منیفلد 1 باشد. دهید.f (gx) = (gof 1 )f X شده باشند سوالات بخش میان ترم

مقایسه ي دو روش رگرسیونی جهت برآورد نسبت شانس در بررسی عامل هاي خطر پر فشاري خون سیستولیک و دیاستولیک در نوجوانان و بزرگسالان شهر شیراز

تمرین اول درس کامپایلر

هدف از انجام این آزمایش بررسی رفتار انواع حالتهاي گذراي مدارهاي مرتبه دومRLC اندازهگيري پارامترهاي مختلف معادله

تاثیر مدهاي کاري جبرانساز خازن سري در خطوط انتقال بر عملکرد رلهدیستانس

هندسه تحلیلی بردارها در فضای R

طراحی و تجزیه و تحلیل کنترل کننده منطق فازي براي کنترل فرکانس بار در سیستم هاي قدرت

Spacecraft thermal control handbook. Space mission analysis and design. Cubesat, Thermal control system

چکیده مقدمه کلید واژه ها:

(Profile Projector) Shiraz Univ Dent J 2009; 9(4): Shiraz Univ Dent J 2009; 9(4)

طراحی و تعیین استراتژی بهره برداری از سیستم ترکیبی توربین بادی-فتوولتاییک بر مبنای کنترل اولیه و ثانویه به منظور بهبود مشخصههای پایداری ریزشبکه

کنترل جریان موتور سوي یچ رلوکتانس در سرعت هاي بالا بر مبناي back-emf

یونیزاسیون اشعهX مقدار مو ثر یونی را = تعریف میکنیم و ظرفیت مو ثر یونی نسبت مقدار مو ثر یونی به زمان تابش هدف آزمایش: مقدمه:

6- روش های گرادیان مبنا< سر فصل مطالب

1- مقدمه. 2 Action. 1 Heuristic

1- مقدمه ای بر شبیه سازی< سر فصل مطالب

ارزیابی بهره وری متقاطع DEA بر پایه بهبود پارتو

فصل پنجم زبان های فارغ از متن

هدف از این آزمایش آشنایی با برخی قضایاي ساده و در عین حال مهم مدار از قبیل قانون اهم جمع آثار مدار تونن و نورتن

ارزیابی نسبت حداکثرتغییر مکان غیرالاستیک به الاستیک در رابطه تغییر مکان هدف در تحت شتاب نگاشتهاي ایران و شتاب نگاشت هاي مصنوعی

فصل سوم جریان های الکتریکی و مدارهای جریان مستقیم جریان الکتریکی

مارکوف 1.مقدمه: سید مهدی صفوی محمد میکاییلی محمد پویان چکیده ما با مطالعه مدل مخفی میدان تصادفی مارکوف از الگوریتم EM

جلسه ی ۱۸: درهم سازی سرتاسری - درخت جست و جوی دودویی

دبیرستان غیر دولتی موحد

نحوه سیم بندي استاتورآلترناتور

مدل های GARCH بوتبوتاسترپ چکیده نصراله ایرانایرانپناه دانشگاه اصفهان طاهره اصالنی گروه آمار- دانشگاه اصفهان

بررسی اثر تبلیغات رسانه ای بر جذب مشتری بانک ها )مطالعه موردی: بانک صادرات شهرستان نیشابور(

مود لصف یسدنه یاه لیدبت

تعارض کار-خانواده (WFC) به عنوان پیشبین خشنودي شغلی

اصول انتخاب موتور با مفاهیم بسیار ساده شروع و با نکات کاربردی به پایان می رسد که این خود به درک و همراهی خواننده کمک بسیاری می کند.

مدل سازي پارامترهاي بالستیک داخلی موتور سوخت جامد توسط مدل پیشنهادي SPPMEF

بسم هللا الرحمن الرحیم

Transcript:

مقایسه مدل هاي حاشیه اي و انتقال براي تحلیل پاسخ هاي دو حالتی: یک مطالعه شبیه سازي 3 2 2 2 1 فرید زایري سوده شهسواري احمدرضا باغستانی سارا جام برسنگ وحید لهرابیان 1) مرکز تحقیقات پروتي ومیکس دانشکده پیراپزشکی دانشگاه علوم پزشکی شهید بهشتی 2) گروه آمار زیستی دانشکده پیراپزشکی دانشگاه علوم پزشکی شهید بهشتی 3) گروه فیزیک پزشکی دانشکده پزشکی دانشگاه علوم پزشکی ایلام چکیده تاریخ دریافت: 91/8/9 تاریخ پذیرش: 91/11/15 مقدمه: مطالعات طولی در بسیاري از شاخه هاي علوم خصوصا در علوم پزشکی بسیار رایج است. در دو دهه اخیر مدل هاي بسیار زیادي براي بررسی این گونه داده ها پیشنهاد شده است. این مدل ها هم چنین براي بررسی متغیرهاي پاسخ مختلف از جمله ترتیبی و دوحالتی که در مطالعات پزشکی کاربرد بسیاري دارند بسط داده شدهاند. با این که تاکنون مقالات بسیاري به مقایسه مدل هاي حاشیه اي و اثرات تصادفی پرداخته اند مطالعات کمتري در مورد مقایسه مدل هاي حاشیه اي و انتقال انجام گرفته است. مواد و روش ها:در این مطالعه با استفاده از شبیه سازي با مقدارهاي مختلف از همبستگی داده ها دقت این دو مدل به وسیله محاسبه سطح زیر منحنی راکمورد مقایسه قرار گرفت و برتري هر یک از دو مدل در شرایط مختلف بیان گردید. یافته هاي پژوهش: اگر افراد سالم با سرعت زیادي بیمار شوند(شدت انتقال از وضعیت سالم به بیمار) و مدت زمان بیشتري را در وضعیت بیماري بگذرانند استفاده از مدل انتقال براي پیش بینی مناسب تر است. هم چنین در شرایطی که شدت انتقال بین دو وضعیت مطالعه یکسان باشد و یا روندي برعکس حالت قبل داشته باشد به این معنی که افراد سالم زمان بیشتري را در وضعیت سلامتی بگذرانند و در صورت بیمار شدن با سرعت بیشتري بهبود یابند استفاده از مدل حاشیه اي براي پیش بینی مناسب تر است. بحث و نتیجه گیري: نتایج به دست آمده از مطالعه حاضر به پژوهشگر این امکان را میدهد که اگر هدف از مطالعه پیش بینی پاسخ باشد علاوه بر در نظر گرفتن مطالب ذکر شده میزان شدت انتقال بین وضعیت ها را نیز جهت انتخاب مدل براي رسیدن به نتایج دقیق تر در نظر بگیرد. واژههاي کلیدي: داده هاي دوحالتی همبستگی مارکوفی مدل حاشیه اي مدل انتقال سطح زیر منحنی راك Email: s.jambarsang@sbmu.ac.ir * نویسنده مسي ول: گروه آمار زیستی دانشکده پیراپزشکی دانشگاه علوم پزشکی شهید بهشتی 161

مقایسه مدل هاي حاشیه اي و انتقال براي تحلیل پاسخ هاي دو حالتی: یک مطالعه شبیه سازي- سارا جام برسنگ مقدمه امروزه مطالعات طولی در بسیاري از شاخه هاي علوم خصوصا در علوم پزشکی بسیار رایج است. داده ها در چنین مطالعاتی حاصل از اندازه گیري مکرر افراد یا واحدهاي آزمایشی هستند. این نوع اندازه گیري واحدها سبب می شود داده هاي حاصل داراي همبستگی درونی باشند. به دلیل وجود همبستگی بین مقادیر به دست آمده مدل هاي معمول در تحلیل داده ها کاربردي نیست و به مدل هایی نیاز است که این همبستگی درونی را در تحلیل داده ها و محاسبه پارامترها به حساب آورند ( 1 ). در دو دهه اخیر مدل هاي بسیار زیادي براي بررسی این گونه داده ها پیشنهاد شده است ( 2 ). سه دسته اصلی این مدل ها مدل هاي حاشیه اي اثرات تصادفی و انتقال(مارکوف) هستند ( 3 4 ). این مدل ها هم چنین براي بررسی متغیرهاي پاسخ مختلف از جمله ترتیبی و دوحالتی که در مطالعات پزشکی کاربرد بسیاري دارند بسط داده شده اند.( 5-7 ) مدل هاي ارایه شده براي تحلیل داده هاي طولی هر کدام به شکلی همبستگی داده ها را در برآورد پارامتر اعمال میکنند. اما ماهیت همبستگی درون داده ها نیز اشکال مختلفی مانند تبادل پذیر (exchangeable) خودبازگشتی(مارکوف) یا بدون ساختار( unstructured )دارد ( 8 ). در این میان همبستگی مارکوفی به دلیل درك عمومی آسان تر و تسهیل در امر برازش مدل و کاهش پارامترهاي آن در اکثر مواقع از مقبولیت زیادي برخوردار است. همبستگی مارکوفی به این معنی است که برآمدهاي آزمایش در هر زمان به برآمدهاي پیشین و در حالت مارکوف مرتبه اول فقط به برآمد پیشین آن وابسته است. یکی از مثال هاي رایج براي درك مفهوم مارکوف برآورد احتمال ابري یا آفتابی بودن چند روز متوالی به شرط دانستن وضعیت هوا در روز اول است ( 9 ). در این مقاله منظور از مدل مارکوف مارکوف مرتبه اول است. از میان سه دسته کلی مدل هاي طولی که بیان شد دو مدل حاشیه اي و انتقال قابلیت احتساب ویژگی مارکوف را در برآورد پارامترهاي خود دارند.( 3 ) با این که تاکنون مقالات بسیاري به مقایسه مدل هاي حاشیه اي و اثرات تصادفی پرداخته اند مطالعات کمتري در مورد مقایسه مدل هاي حاشیه اي و انتقال انجام گرفته است. لیانگ و زیگر در مطالعه اي ضمن بیان تفاوت هاي بنیادي این دو مدل از نظر مفهوم نشان دادند در اکثر مواقع قدر مطلق پارامترهاي برآورد شده از مدل انتقال مقداري کوچک تر از پارامترهاي حاصل از مدل حاشیه اي دارند ( 10 ). ورنر و همکاران نیز این رابطه را براي مقادیر مختلف همبستگی بین متغیر مستقل در هر زمان و پاسخ در یک زمان قبل بررسی کردند.( 11 ) داده هاي دوحالتی سهم عمده اي از داده هاي حاصل از مطالعات پزشکی را تشکیل میدهند ( 12 ). منحنی راك پرکاربردترین ابزار براي بررسی توان پیش بینی مدل هاي مرتبط با پاسخ هاي دوحالتی است. سطح زیر منحنی راك شاخص مناسبی براي بیان این توانایی است ( 13 ). در این مقاله برآورد احتمال ها براي یک سري داده دوحالتی شبیه سازي شده با استفاده از دو مدل حاشیه اي و انتقال به دست آمده و سپس از شاخص سطح زیر منحنی راك براي مقایسه دقت این دو مدل استفاده شده اس ت. در بخش هاي بعدي مختصري از ماهیت مدل هاي حاشیه اي و انتقال مورد استفاده در این مطالعه و هم چنین داده هاي شبیه سازي شده به منظور مقایسه دو مدل بیان شده است. در انتها نیز نتایج شبیه سازي و بحث ارایه می شود. مواد و روش ها مدل حاشیهاي در مدل حاشیه اي اثر متغیرهاي تبیینی بر روي پاسخ و همبستگی درونی داده ها به صورت جداگانه مدل بندي میشوند ( 14 ). در مدل حاشیه اي میانگین جامعه به عنوان تابعی از متغیرهاي تبیینی به )h بیان میشود که h در آن ) X صورت یک تابع پیوند نامیده شده و مثلا وضعیتی که پاسخ ها دوحالتی هستند می تواند تابع لوجیت باشد. در این مدل برآورد پارامترها همبستگی درون موردي با استفاده از روش معادلات برآوردي تعمیم یافته( GEE ) با در نظر گرفتن یک ماتریس همبستگی اعمال 162

آن log it Pr( Y 1) 0 1t logitpr( Y logit Pr( Y 1 Y 1 y ) 1 Y 1 y ) X y 0 1 t y X می شود ( 3 ). در این مطالعه ماتریس همبستگی به شکلی در نظر گرفته می شود که داراي خاصیت مارکوف باشد. در این حالت مدل به شکل زیر بیان میشود: t زمان هاي مشاهده پاسخ که در مطالعه حاضر در نظر گرفته شده است. ساختار همبستگی به میباشد که zj متغیرهاي صورت تصادفی دو به دو مستقل و داراي توزیع N(0,σ2) میباشد ( 8 ) که در هستند. هم چنین مدل انتقال(مارکوف) یک زنجیر مارکوف مرتبه اول به وسیله ماتریس احتمال انتقال آن مشخص می شود. یک ماتریس 2 2 ab نشاندهنده احتمال قرار گرفتن که درایه هاي آن در وضعیت b در زمان t به شرط قرار داشتن در وضعیت a در زمان t 1 است. رابطه بین احتمال هاي انتقال و متغیرهاي تبیینی با استفاده از یک مدل لوجستیک که حاصل ترکیب دو مدل لوجستیک براي هر یک از حالت هاي پاسخ در زمان t 1 به راحتی به شکل زیر قابل بیان است ( 14 ): در این مطالعه مدل با یک متغیر مستقل که زمان است به شکل زیر در نظر گرفته شده است: 1 منحنی مشخصه عملکرد (Receiving Operating Characteristics Curve) منحنی مشخصه عملکرد(منحنی راك) یک ابزار تشخیصی بسیار مفید خصوصا در علوم پزشکی است و رابطه بین حساسیت و ویژگی را در یک آزمون بررسی می کند. برآوردهاي بر مبناي مدل منحنی راك به این دلیل که فرصت ارزیابی اثر متغیرهاي پیش بینی را روي دقت مدل هاي آماري ایجاد می کند بسیار مفید هستند ( 13 ). این منحنی براي ارزیابی دقت و توان پیش بینی آزمون هاي تشخیصی و مدل هاي آماري ملاك هاي متعددي از جمله مساحت زیر منحنی (AUC) طول تصویر منحنی( PLC ) و ناحیه پیچ خورده منحنی( ASC ) دارد ( 15 ). در بین این ملاك ها مساحت زیر منحنی راك رایج تر است. این اندازه مقداري بین صفر و یک را میگیرد و مقادیر نزدیک یک دقت بالاتر را نشان میدهند.( 13 ) شبیه سازي براي بررسی این مطلب که در صورت برقراري خاصیت مارکوف در داده ها کدام یک از دو مدل حاشیه اي یا انتقال که قابلیت احتساب این ویژگی را دارند برازش بهتري دارند یک مطالعه شبیه سازي به این شرح طراحی شد. با استفاده از بسته نرم افزاري (16) msm یک سري داده دودویی با همبستگی مارکوفی با 3 نوع ماتریس شدت انتقال شبیه سازي شد. این داده ها با تکرارهاي زمانی 10 5 3 و 15 تایی و در حجم نمونه هاي 20 و 50 تایی تولید شدند و براي هر ترکیب از این تکرار حجم نمونه و ماتریس شدت انتقال شبیه سازي 1000 بار تکرار شد. براي مقایسه قابلیت رده بندي صحیح دو مدل در هر ترکیب شبیه سازي شده به وسیله دو مدل ذکر شده احتمال ه يا برآورد و سطح زیر منحنی راك محاسبه گردید ( 17 ). در انتها میانگین دو سطح زیر منحنی به عنوان معیار مقایسه دو مدل در نظر گرفته شد. یافته هاي پژوهش هدف از انجام این مطالعه ارزیابی دو مدل مارکف و حاشیه اي با همبستگی مارکف مرتبه اول وقتی خاصیت مارکفی در داده ها برقرار است بود. بدین منظور داده هایی با تکرارهاي متفاوت و ماتریس هاي شدت انتقال مختلف تولید شد که پس از مدل بندي با استفاده از سطح زیر منحنی راك دقت دو مدل مورد ارزیابی قرار گرفت. همانگونه که از جدول شماره 1 مشاهده میشود m تعداد موارد شامل شده در مطالعه را نشان میدهد که براي آن با دو مقدار 20 و 50 شبیه سازي اجرا شد. به علاوه تعداد اندازهگیري هاي تکرار شده 163

مقایسه مدل هاي حاشیه اي و انتقال براي تحلیل پاسخ هاي دو حالتی: یک مطالعه شبیه سازي- سارا جام برسنگ متغیر پاسخ براي هر مورد با n نمایش داده شده است که در این مطالعه تعداد تکرارها 3 5 15 10 در نظر گرفته شد. هر کدام از اعداد جدول نشان دهنده مساحت زیر منحنی راك است که مقادیر بالاتر نشان دهنده دقت بالاتر در پیش بینی مدل است. براي مثال مقدار 0/8473 نشان می دهد با سه اندازه گیري تکرار شده براي پاسخ و برازش مدل انتقال با ماتریس شدت انتقال اول دقت پیش بینی خوبی وجود دارد در حالی که با همین مدل در حالی که ماتریس انتقال دوم استفاده شده و تعداد تکرارها زیاد است دقت پیش بینی 0/5750 با توجه به این که نزدیک 0/5 است مناسب نیست. زمانی که ماتریس شدت انتقال به صورت 1 تعریف شده است که در آن افراد با شدت کمتري در وضعیت سلامت باقی میمانند و در عوض تغییر ماتریس انتقال مدل وضعیت فرد سالم به بیمار با شدت بیشتري رخ میدهد وقتی تکرارها زیاد است( 10 و 15) مدل انتقال دقت بیشتري را به خود اختصاص داده است و در تکرارهاي کم اختلاف دقت در دو مدل ناچیز است. به علاوه وقتی افراد با احتمال هاي یکسانی در وضعیت خود باقی می مانند یا تغییر وضعیت میدهند معمولا مدل حاشیه اي بهتر عمل می کند خصوصا زمانی که تعداد تکرارها کم باشد. در حالتی برعک س 1 که فرد با احتمال کمتري در وضعیت خود باقی می ماند و با شدت بیشتري تمایل به تغییر وضعیت دارد نیز مدل حاشیه اي بر مدل انتقال برتري دارد. هم چنین نتایج مشاهده شده براي حالت هاي مختلف تعداد تکرارها و ماتری س هاي شدت انتقال در هر دو نمونه 20 و 50 تایی مشابه بود. جدول شماره 1. برآورد سطح زیر منحنی راك براي مدل هاي حاشیه اي و انتقال 3 0/8473./8465 0/6251 0/7666 0/6165 تعداد بیماران= 20 تعداد تکرار ها براي هر فرد 3 0/8502 0/8471 0/6582 0/7660 0/6425 15 0/6795 0/6333 0/5750 0/5729 0/5536 10 0/7197 0/6833 0/5901 0/6053 0/5674 5 0/7989 0/7790 0/6209 0/6903 0/6122 تعداد بیماران= 50 تعداد تکرار ها براي هر فرد 15 0/6740 0/6337 0/5682 0/5737 0/5451 10 0/7140 0/6820 0/5813 0/6085 0/5654 5 0/7953 0/7788 0/6114 0/6900 0/6068 0/15 0/25 0/20 0/80 0/85 750 0/80 0/20 انتقال حاشیه اي انتقال حاشیه اي انتقال حاشیه اي 0/5651 0/5951 0/6754 0/7578 0/5645 0/5923 0/6749 0/7563 x بحث و نتیجه گیري اصطلاح حاشیه اي به این معنی است که میانگین پاسخ در هر موقعیت تنها به مقدار متغیر همراه مورد نظر وابسته است و نه به اثرات تصادفی یا پاسخ هاي پیشین در صورتی که در مدل انتقال و به طور کلی مدل هاي شرطی(مارکوف) میانگین پاسخ به پاسخ هاي قبلی نیز وابسته است. استفاده از مدل هاي حاشیه اي راه ساده تري براي بسط مدل هاي خطی تعمیم یافته به مدل طولی است. این روش میانگین پاسخ در هر موقعیت را به E( Y ) راحتی با یک تابع ربط مدل بندي می کند. به دلیل اینکه تاکید اصلی بر روي میانگین پاسخ و ارتباط آن با متغیر همراه است مدل حاشیه اي نیازي به مشخص بودن توزیع کامل بردار پاسخ هاي تکرار شده ندارد ( 1 ). این ویژگی خصوصا در پاسخ هاي دو و چندحالتی بسیار راهگشا است. با این حال یک فرضیه مبهم در این مدل اغلب نادیده گرفته میشود. در مدل هاي حاشیه اي فرض میشود میانگین شرطی j امین پاسخ به شرط x تنها به به شکل زیر وابسته است: i1,..., x in E( Y i ) E( Y i1,..., X in) E( Y ) در متغیرهاي همراهی که در طول زمان تغییر نمی کنند این فرضیه ضرورتا حفظ میشود. هم چنین 164

براي متغیرهایی که در طول زمان تغییر میکنند اما بر اساس طراحی مطالعه ثابت در نظر گرفته شدهاند این وضعیت برقرار است. با این حال براي متغیرهاي همراه غیرثابت در زمان که به صورت تصادفی در طول مطالعه تغییر کنند این فرضیه نقض می شود. به این ترتیب در شرایطی که متغیرهاي همراه غیرثابت در طول زمان وجود دارد با ملاحظه بیشتري باید از یک مدل حاشیه اي استفاده شود.( 18 ) همان طور که پیش از این نیز ذکر شد در مدل حاشیه اي چون مدل بندي میانگین پاسخ به صورت جداگانه از همبستگی درونی داده ها انجام می گیرد این شکل از مدل بندي نقش مهمی در تعبیر پارامترهاي مدل دارد. پارامترها در این مدل چگونگی تغییرات میانگین پاسخ در طول زمان و نوع ارتباط این تغییرات با متغیرهاي همراه را توصیف میکند. این نکته قابل توجه است که چون برآوردها در این مدل نسبت به ساختار کواریانس استوار( Robust ) هستند تعبیر پارامترهاي مدل به فرضیات در مورد ماهیت و مقدار همبستگی درونی داده ها بستگی ندارد.( 14 ) مدل هاي انتقال مدل سازي را به طور هم زمان روي میانگین و همبستگی درونی انجام میدهند. این کار به وسیله شرطی کردن هر برآمد روي بقیه برآمدها و یا مجموعه اي از بقیه برآمدها صورت میگیرد. به دلیل ماهیت دنباله اي داده هاي طولی استفاده از مدل هاي انتقال مناسب به نظر می رسد. در مدل هاي انتقال توزیع شرطی هر پاسخ به صورت تابعی معلوم از پاسخ هاي پیشین و متغیرهاي همراه بیان می شود.( 18 ) اگرچه مدل هاي مارکوف و خودبازگشتی پیشینه اي طولانی و گسترده از نظر استفاده در داده هاي سري زمانی دارند کاربرد آن ها در داده هاي طولی با محدودیت هایی همراه است. برخی جنبه هاي مدل هاي انتقال مناسب بودن آن ها را در مدل سازي داده هاي طولی تحت تاثیر قرار میدهد. از جمله محدودیت ها میتوان به این موارد اشاره کرد به طور کلی مدل هاي انتقال براي داده هاي تکراري که در بازه هاي زمانی یکسان اندازه گیري شده اند بسط داده شده است. هم چنین کاربرد آن ها در موقعیت هایی که داده هاي گم شده زمان هاي گم شده و اندازه گیري هاي نامنظم و فاصله هاي غیریکسان بین اندازه گیري ها وجود داشته باشد بسیار مشکل است ( 3 ). علاوه بر آن تعبیر ضرایب رگرسیونی با تغییر ترتیب همبستگی سریالی تغییر می کند. در نهایت ممکن است در بسیاري از مطالعات این ضرایب هدف معمول را دنبال نکنند چون وابستگی به داده هاي قبلی میتواند سبب شود اثر متغیرهاي مورد علاقه کم برآورد شود در واقع دیدن پاسخ ها را به شرط پاسخ هاي قبلی در شرایطی که انتظار داریم متغیر همراه بر مقدار میانگین پاسخ در تمام موقعیت ها اثر داشته باشد سبب شود این اثر نادیده گرفته شود.( 18 ) در این مطالعه که هدف مقایسه مدل حاشیه اي و انتقال بود نتایج زیر به دست آمد: وضعیت اول حالتی است که ماتریس شدت انتقال به گونه اي است که فرد با شدت کمتري تمایل دارد در وضعیت سالم قرار بگیرد یعنی شدت انتقال از وضعیت بیمار به سالم 0/25 و ماندن در وضعیت سالم 0/15 است و در عوض تمایل به بودن در وضعیت بیماري با شدت بیشتري رخ می دهد که فرد بیمار با شدت انتقال 0/75 تمایل دارد در همان وضعیت باقی بماند و فرد سالم با شدت انتقال 0/85 به وضعیت بیماري می رود. در این حالت تقریبا در کل شرایط هاي مطالعه برازش مدل انتقال مناسب تر است البته زمانی که تعداد تکرارها زیاد است اختلاف دقت به نفع مدل انتقال بیشتر میشود. وضعیت دوم حالتی است که ماتریس شدت انتقال نشان میدهد تمایل فرد براي تغییر وضعیت به وضعیت دیگر یا ماندن در وضعیت کنونی یرابر 0/5 است و شدت انتقال در کل وضعیت ها یکسان است. در این حالت مدل حاشیه اي همواره بهتر عمل می کند و اختلاف دقت با تکرارهاي اندازه گیري کمتر به نفع مدل حاشیهاي بیشتر است. وضعیت سوم ماتریس شدت انتقال حالتی را نشان میدهد که فرد با شدت بیشتري 0/8 تمایل به تغییر وضعیت دارد در حالی که تمایل به ماندن در وضعیت کنونی با شدت کمتر و برابر 0/2 است. در این حالت اختلاف دقت وقتی اندازه گیري هاي تکرار شده براي 165

مقایسه مدل هاي حاشیه اي و انتقال براي تحلیل پاسخ هاي دو حالتی: یک مطالعه شبیه سازي- سارا جام برسنگ پاسخ کم است به نفع مدل حاشیه اي است در حالی که با تکرارهاي بیشتر دقت مدل انتقال بیشتر است. مزایا و معایب ذکر شده در بالا و هم چنین هدف محقق از برازش مدل باعث انتخاب یکی از دو مدل انتقال یا حاشیه اي در داده هاي طولی میشود. نتایج به دست آمده از مطالعه حاضر به پژوهشگر این امکان را می دهد که اگر هدف از مطالعه پیش بینی پاسخ باشد علاوه بر در نظر گرفتن مطالب ذکر شده میزان شدت انتقال بین وضعیت ها را نیز جهت انتخاب مدل براي رسیدن به نتایج دقیق تر در نظر بگیرد. به این ترتیب در مواردي که شدت انتقال افراد از وضعیت اول(صفر سالم بودن...) به وضعیت دوم(یک بیمار شدن...) زیاد و شدت انتقال به عکس این وضعیت کم باشد و یا به عبارت بهتر افراد سالم با سرعت زیادي بیمار شوند(شدت انتقال از وضعیت سالم به بیمار) و مدت زمان بیشتري را در وضعیت بیماري بگذرانند استفاده از مدل انتقال براي پیش بینی مناسب تر است. هم چنین در شرایطی که شدت انتقال بین دو وضعیت مطالعه یکسان باشد و یا روندي برعکس حالت قبل داشته باشد به این معنی که افراد سالم زمان بیشتري را در وضعیت سلامتی بگذرانند و در صورت بیمار شدن با سرعت بیشتري بهبود یابند استفاده از مدل حاشیه اي براي پیش بینی مناسب تر است. References 1-Parzen M, Ghosh S, Lipsitz S. A generalized linear mixed model for longitudinal binary data with a marginal logit link function. Ann Appl Stat 2011;5(1):449-67. 2-Liu I, Agresti A. The Analysis of ordered categorical data. An overview and a survey of recent developments. TEST 2005;14:1-73. 3-Diggle PJ, Heagerty P, Liang KY, Zeger SL, editors. Analysis of longitudinal data. 2 th ed. Oxford University Press; 2004. 4-Agresti A, editors. Analysis of ordinal categorical data. 2 th ed. New York: Wiley; 2010. 5-Heagerty P. Marginalized transition models and likelihood inference for longitudinal categorical data. Biometrics 2002;58:342-51. 6-Heagerty P. Marginally specified logisicnormal models for longitudinal binary data. Biometrics 1999;55:247-57. 7-Agresti A, Lang J. A proportional odds model with subject-specific effect for repeated ordered categorical responses. Biometrika 1993;80:527-34. 8-Fitzmaurice GM, Laird NM, Ware JH, editors. Applied Longitudinal Analysis. 2 th ed. John Wiley & sons; 2011. 9-Rabiner LR. A Tutorial on hidden markov models and selected applications in speech recognition. Proc IEEE 1989;77:257-86. 10-Zeger SL, Liang KY. An overview of methods for the analysis of longitudinal data. Stat Med 1992;11:1825-39. 11-Sullivan PM, Andersona GL. A cautionary note on inference for marginal regression models with longitudinal data and general correlated response data. Commun Stat Simul Comput 1994;23:939-51. 12-Hu FB, Goldberg J, Hedeker D, Flay BR, Pentz MA. Comparison of populationaveraged and subject-specific approaches for analyzing repeated binary outcomes. Am J Epidemiol 1998;147:694-703. 13-Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology 1982;143:29-36. 14-Rezaei Ghahroodi Z, Ganjali M. Models for Longitudinal analysis of binary response data for identifying the effects of different treatments on insomnia. Appl Math Sci 2010;4:3067-82. 15-Lee WC, Hsiao CK. Alternative Summary indices for the receiver operating characteristic curve. Epidemiology 1996;7: 605-11. 16-Titman AC, Sharples LD. Model diagnostics for multi-state models. Stat Methods Med Res 2010;19:621-51. 17-Honghu Liu GL, Cumberland WG, Wu T. Testing Statistical Significance of the Area under a Receiving Operating Characteristics Curve for Repeated Measures Design with Bootstrapping. J Data Sci 2005;3:257-78. 18-Fitzmaurice G, Molenberghs G. Advances in longitudinal data analysis. An historical perspective. In: Longitudinal Data Analysis. Chapman & Hall/CRC; 2008. 166

Abstract Comparing Marginal and Transition Models In The Analysis of Binary Longitudinal Data: a Simulation Study Zayeri F 1, Shahsavari S 2, Baghestani A.R 2, Jambarsang S 2*, lohrabian V 3 Introduction: Longitudinal studies widely used in many branches of science, especiallly medical science. In the past two decades, many models have been proposed for the evaluation of such data. These models are also developed to investigate various response variables such that categorical variables that have many applications in medical research. While many papers have compared the marginal and random effects models but fewer studies have compared the marginal and transition models. Materials & Methods: This paper used simulation with different scenarios for correlation, sample size and repeated measures and calculated ROC Curve for two models. Then estimated AUC for them and comparison was performed. (Received: 30 Oct. 2012 Accepted: 3 Feb. 2013) Findings: If intensity transition for healthy to disease was large and patient remained disease for a long time that is better used transition model to prediction. In addition, in conditions that intensity transition in any status was equal or trends of transition intensity was inverse of position1 that healthy people remained health for a long time and patients recovered quickly, that is better used marginal model. Discussion & Conclusion: In analysis of longitudinal data for achieving more accurate results when purpose of study was prediction, that is better intensity transition between status was considered and then decided which model is choosen. Keywords: binary data, markov correlation, marginal model, transition model, roc area under curve 1. Proteomics Research Center, Faculty of Paramedical Sciences, Shahid Beheshti University of Medical Sciences, Tehran, Iran 2. Dept of Biostatistics, Faculty of Paramedical Sciences, Shahid Beheshti University of Medical Sciences, Tehran, Iran 3. Dept of Medical Physics, Faculty of Medicine, Ilam University of Medical Sciences, Ilam, Iran *(corresponding author) Scientific Journal of Ilam University of Medical Sciences 167